Looker Studioで統合を使う時の注意点まとめ
データアナリティクス事業本部の武田です。 今日は、Looker Studio(旧データポータル)で統合を使う時の注意点をご紹介します。
Looker Studioの統合とは?
複数のデータソースを統合して、一つのグラフに表示する機能です。 SQLで言うと結合です。 Looker Studioには自分でSQLを書く機能はありませんので、 画面上のビジュアルで設定していくことになります。
Looker Studioの統合の注意点まとめ
1.参照できるデータソースは5個まで
2.設定できるカラムは1データソースごとに、ディメンション10個、指標20個まで
3.統合後のデータソースに計算フィールドを追加したい場合は、統合画面ではなくグラフのプロパティの指標から追加する
4.結合キーのデータ型は必ず一致させておく必要がある
5.統合の参照元のデータソースの数値は集計されない
注意点1 参照できるデータソースは5個まで
統合で使えるデータソースは5つまでです。それ以上は追加するボタンが表示されません。
細かくデータソースが分割されていたり、参照マスターデータソースが多い場合、あっという間に上限に到達します。 統合同士を統合する機能もありませんので、上限に達してしまった場合は、DBを用意してDB側で処理しておくことをお勧めします。
注意点2 設定できるカラムは1データソースごとに、ディメンション10個、指標20個まで
統合で使えるカラム数はデータソースごとに上限があります。それ以上は追加するボタンが表示されません。
ディメンションは、グラフでは軸となります。例えば、分類のようなカラムで、データを区切るものです。10個までしか登録できず、それ以上は追加ボタンが表示されません。
指標は、集計される値のことです。例えば、売上のような数字のカラムで、グラフでは棒になったり折れ線になったりします。各データソースに設定された計算フィールドを含みます。20個までしか登録できず、それ以上は追加ボタンが表示されません。
分類が多い場合や、集計する計算フィールドが多い場合は、DBを用意してDB側で処理して、統合を使わなくても良いようにしておくことをお勧めします。
注意点3 統合後のデータソースに計算フィールドを追加したい場合は、統合画面ではなくグラフのプロパティの指標から追加する
統合後のデータソースに複数のデータソースを使った計算フィールドは追加するには、プロパティの指標からフィールドを追加します。統合の編集画面での計算フィールドを作ろうとするとエラーとなってしまいますのでご注意ください。
下記は、Looker Studioヘルプページに具体例として紹介されているデータをグーグルスプレッドシートにコピーして作成したものです。
1つ目のデータソース
2つ目のデータソース
この二つを統合して作ったデータソースに対して、グラフのプロパティから計算フィールドを編集します。
できた計算フィールドを一覧表に表示してみました。
ちなみに、統合の管理画面から、異なる参照元データソースを使った計算フィールドを設定しようとすると、カラムが存在しないというエラーが発生してしまいます。試したのが下記の画面です。
統合の管理画面を開いて、指標を追加してみます。
一番下のフィールドを追加をクリックして、計算フィールド編集画面を開きます。
データソースを跨いだカラムを入力すると、エラーになってしまいました。
こうなってしまうので、データソースを跨いだ計算フィールドを作りたい場合は、グラフを選択してデータ統合を行い、グラフのプロパティから計算フィールドを設定します。
注意点4 結合キーのデータ型は必ず一致させておく必要がある
結合する場合、文字列なら文字列と、数値は数値と紐づけます。 よくあるのは、CSV等でデータソースを作った場合、想定と違うデータ型が自動的にセットされていて、文字列と数値になってしまっていたというパターンです。
また、結合で使えるのは等号のみです。クエリであれば不等号も使えるんですが、Looker Studioの統合では不等号は使えませんので、ご注意ください。
注意点5 統合の参照元のデータソースの数値は集計されない
Looker Studioのヘルプでは下記のように書かれています。
基となるデータソースの指標は、統合では数値ディメンションとなり、集計されません。本来の使い方としては、「平均値の平均値を計算する」という再集計に使うことができる機能です。
引用元:統合の仕組み
この機能のため、私がハマった思わぬ落とし穴がありましたので、Tableauインストール時についてくるサンプルスーパーストアのデータを用いて説明します。
下記は、取り込んだデータを、そのままオーダー月ごとに売上を修正した一覧表です。
ここで使った同じデータをそのまま統合してみます。
この統合を使って、上と同じ一覧表を作ると、結果が違います。
この原因は、統合がオーダー月を日付別にディメンションとして持っているからです。その後の一覧表では日付フォーマットだけを月単位にしているだけで、月別に集計してはくれません。
一覧表の日付フォーマットを日に直してみると、「フォーマットだけ月にしていて、月別に集計はしていない」ということがわかると思います。
ふりかえり
今日は、Looker Studio(旧データポータル)で統合を使う時の注意点をご紹介しました。 思わぬ落とし穴にハマったので書くことにしましたが、Looker Studioの仕様と本来の使い方を一通り理解していればもっと早く解決できたと思います。 少しでも皆様のお役に立てれば幸いです。